Published on

AI Reader 工具

Authors

类似Jina AI Reader的工具

  1. Markdowner: 一个开源工具,可以快速将网站转换为Markdown格式数据。它支持自动爬虫、详细模式和JavaScript网站.

  2. Crawl4AI: 可以将网页内容提取为JSON格式,并提供干净的HTML和Markdown文件。适用于RAG(检索增强生成)、微调和AI聊天机器人开发.

  3. FireCrawl: 能够抓取网站的所有可访问子页面,无需站点地图,并将内容转换为干净的Markdown格式。即使对于使用JavaScript动态生成内容的网站也能有效抓取.

  4. Scrapegraph-ai: 使用LLM和直接图形逻辑为网站和本地文档(XML、HTML、JSON等)创建抓取流程。用户只需指定想要提取的信息类型,它就能自动执行数据抓取任务.

  5. Skyvern: 支持使用自然语言进行网页导航、数据爬取、填写表单等复杂多步操作。还支持绕过CAPTCHA/Authentication等验证操作.

  6. EasySpider(易采集): 一个免费开源的可视化爬虫工具,允许用户无需编码即可图形化设计和执行爬虫任务.